智能论文笔记

A provably stable neural network Turing Machine

John Stogin , Ankur Mali , C Lee Giles

分类：机器学习 | (统计)机器学习

2020-06-05

我们介绍了神经堆栈体系结构，包括一个可区分的参数化堆栈操作员，该堆栈操作员近似堆栈推送和弹出操作，以选择明确表示堆栈的参数选择。我们证明了这种堆栈体系结构的稳定性：在任意许多堆栈操作之后，神经堆栈的状态仍然与离散堆栈的状态非常相似。使用神经堆栈和复发性神经网络，我们引入了神经网络下降自动机（NNPDA），并证明具有有限/有界神经元的NNPDA可以模拟任何PDA。此外，我们扩展了建筑，并提出了新的建筑神经状态图灵机（NNTM）。我们证明，具有有界神经元的可区分NNTM可以实时模拟图灵机（TM）。就像神经堆栈一样，这些架构也很稳定。最后，我们扩展了构造，以表明可区分的NNTM等同于通用图灵机（UTM），并且只能使用\ textbf {七个有限/有限的精度}神经元模拟任何TM。这项工作为有界精度RNN的计算能力提供了新的理论界限，并随着内存增强。

translated by 谷歌翻译

Lifelong Neural Predictive Coding: Learning Cumulatively Online without Forgetting

Alexander Ororbia , Ankur Mali , Daniel Kifer , C. Lee Giles

分类：机器学习 | 神经与进化计算 | (统计)机器学习

2019-05-25

在基于人工神经网络的终身学习系统中，最大的障碍之一是在遇到新信息时无法保留旧知识。这种现象被称为灾难性遗忘。在本文中，我们提出了一种新型的连接主义架构，即顺序的神经编码网络，在从数据点流中学习时忘记了，并且与当今的网络不同，它不会通过流行的错误反向传播来学习。基于预测性处理的神经认知理论，我们的模型以生物学上可行的方式适应了突触，而另一个神经系统学会了指导和控制这种类似皮层的结构，模仿了一些基础神经节的某些任务连续控制功能。在我们的实验中，我们证明了与标准神经模型相比，我们的自组织系统经历的遗忘大大降低，表现优于先前提出的方法，包括基于排练/数据缓冲的方法，包括标准（SplitMnist，SplitMnist，Split Mnist等）。）和定制基准测试，即使以溪流式的方式进行了训练。我们的工作提供了证据表明，在实际神经元系统中模仿机制，例如本地学习，横向竞争，可以产生新的方向和可能性，以应对终身机器学习的巨大挑战。

translated by 谷歌翻译

Advances in Multi-Variate Analysis Methods for New Physics Searches at the Large Hadron Collider

Anna Stakia , Tommaso Dorigo , Giovanni Banelli , Daniela Bortoletto , Alessandro Casa , Pablo de Castro , Christophe Delaere , Julien Donini , Livio Finos , Michele Gallinaro

分类：机器学习

2021-05-16

在2015年和2019年之间，地平线的成员2020年资助的创新培训网络名为“Amva4newphysics”，研究了高能量物理问题的先进多变量分析方法和统计学习工具的定制和应用，并开发了完全新的。其中许多方法已成功地用于提高Cern大型Hadron撞机的地图集和CMS实验所执行的数据分析的敏感性;其他几个人，仍然在测试阶段，承诺进一步提高基本物理参数测量的精确度以及新现象的搜索范围。在本文中，在研究和开发的那些中，最相关的新工具以及对其性能的评估。

translated by 谷歌翻译

Outlier-Robust Sparse Mean Estimation for Heavy-Tailed Distributions

Ilias Diakonikolas , Daniel M. Kane , Jasper C. H. Lee , Ankit Pensia

分类：机器学习 | (统计)机器学习

2022-11-29

We study the fundamental task of outlier-robust mean estimation for heavy-tailed distributions in the presence of sparsity. Specifically, given a small number of corrupted samples from a high-dimensional heavy-tailed distribution whose mean $\mu$ is guaranteed to be sparse, the goal is to efficiently compute a hypothesis that accurately approximates $\mu$ with high probability. Prior work had obtained efficient algorithms for robust sparse mean estimation of light-tailed distributions. In this work, we give the first sample-efficient and polynomial-time robust sparse mean estimator for heavy-tailed distributions under mild moment assumptions. Our algorithm achieves the optimal asymptotic error using a number of samples scaling logarithmically with the ambient dimension. Importantly, the sample complexity of our method is optimal as a function of the failure probability $\tau$, having an additive $\log(1/\tau)$ dependence. Our algorithm leverages the stability-based approach from the algorithmic robust statistics literature, with crucial (and necessary) adaptations required in our setting. Our analysis may be of independent interest, involving the delicate design of a (non-spectral) decomposition for positive semi-definite matrices satisfying certain sparsity properties.

translated by 谷歌翻译

Data-Driven Blind Synchronization and Interference Rejection for Digital Communication Signals

Alejandro Lancho , Amir Weiss , Gary C. F. Lee , Jennifer Tang , Yuheng Bu , Yury Polyanskiy , Gregory W. Wornell

分类：人工智能 | 机器学习

2022-09-11

我们研究了数据驱动的深度学习方法的潜力，即从观察它们的混合物中分离两个通信信号。特别是，我们假设一个信号之一的生成过程（称为感兴趣的信号（SOI）），并且对第二个信号的生成过程不了解，称为干扰。单通道源分离问题的这种形式也称为干扰拒绝。我们表明，捕获高分辨率的时间结构（非平稳性），可以准确地同步与SOI和干扰，从而带来了可观的性能增长。有了这个关键的见解，我们提出了一种域信息神经网络（NN）设计，该设计能够改善“现成” NNS和经典检测和干扰拒绝方法，如我们的模拟中所示。我们的发现突出了特定于交流领域知识的关键作用在开发数据驱动的方法方面发挥了作用，这些方法具有前所未有的收益的希望。

translated by 谷歌翻译

Predict+Optimize for Packing and Covering LPs with Unknown Parameters in Constraints

Xinyi Hu , Jasper C. H. Lee , Jimmy H. M. Lee

分类：人工智能 | 机器学习

2022-09-08

预测+优化是一个最近提出的框架，将机器学习和约束优化结合在一起，解决包含在求解时间未知参数的优化问题。目标是预测未知参数，并使用估计值来解决优化问题的估计最佳解决方案。但是，所有先前的作品都集中在未知参数仅出现在优化目标而不是约束中的情况下，其简单原因是，如果不确定的约束，则估计的最佳解决方案在真实参数下甚至可能是可行的。。本文的贡献是两个方面。首先，我们为预测+优化设置提出了一个新颖且实际相关的框架，但是在目标和约束中都有未知参数。我们介绍了校正函数的概念，并在损失函数中的额外惩罚项进行了建模实际情况，在该方案中可以将估计的最佳解决方案修改为可行的解决方案，并在揭示了真实参数后，但以额外的成本进行了修改。其次，我们为我们的框架提出了相应的算法方法，该方法处理所有包装和涵盖线性程序。我们的方法灵感来自先前的曼迪和枪支工作，尽管对我们的不同环境进行了关键的修改和重新启示。实验证明了我们方法比经典方法的卓越经验表现。

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译

Exploiting Temporal Structures of Cyclostationary Signals for Data-Driven Single-Channel Source Separation

Gary C. F. Lee , Amir Weiss , Alejandro Lancho , Jennifer Tang , Yuheng Bu , Yury Polyanskiy , Gregory W. Wornell

分类：人工智能 | 机器学习

2022-08-22

我们研究了单通道源分离（SCSS）的问题，并专注于环化信号，这些信号特别适用于各种应用领域。与经典的SCSS方法不同，我们考虑了一个仅可用源的示例而不是模型的设置，从而激发了数据驱动的方法。对于具有基本环化高斯成分的源模型，我们为任何基于模型或数据驱动的分离方法建立了可达到的均方误差（MSE）的下限。我们的分析进一步揭示了最佳分离和相关实施挑战的操作。作为一种计算吸引力的替代方案，我们建议使用U-NET体系结构进行深度学习方法，该方法与最低MSE估计器具有竞争力。我们在模拟中证明，有了合适的域信息架构选择，我们的U-NET方法可以通过大幅减少的计算负担来达到最佳性能。

translated by 谷歌翻译

Deep learning for enhanced free-space optical communications

Manon P. Bart , Nicholas J. Savino , Paras Regmi , Lior Cohen , Haleh Safavi , Harry C. Shaw , Sanjaya Lohani , Thomas A. Searles , Brian T. Kirby , Hwang Lee

分类：机器学习

2022-08-15

大气效应（例如湍流和背景热噪声）抑制了在开关键控自由空间光学通信中使用的相干光的传播。在这里，我们介绍并实验验证了卷积神经网络，以降低后处理中自由空间光学通信的位错误率，而自由空间光学通信的位比基于高级光学器件的现有解决方案明显简单，更便宜。我们的方法由两个神经网络组成，这是第一个确定在热噪声和湍流中存在相干位序列以及第二个解调相干位序列的存在。通过生成连贯的光线，将它们与热灯结合在一起，并通过湍流的水箱将其结合起来，通过生成开关的键入键流，可以通过实验获得我们网络的所有数据，从而获得了模拟的湍流，并将其传递给了最终的光线。高度准确性。我们的卷积神经网络提高了与阈值分类方案相比的检测准确性，并具有与当前解调和误差校正方案集成的能力。

translated by 谷歌翻译

ELF22: A Context-based Counter Trolling Dataset to Combat Internet Trolls

Huije Lee , Young Ju NA , Hoyun Song , Jisu Shin , Jong C. Park

分类：自然语言处理

2022-07-30

在线巨魔增加了社会成本，并对个人造成心理损害。随着自动化帐户利用机器人进行拖钓的扩散，目标个人用户很难在定量和定性上处理这种情况。为了解决这个问题，我们专注于自动化对抗巨魔的方法，因为对战斗巨魔的反应鼓励社区用户在不损害言论自由的情况下保持持续的讨论。为此，我们为自动反响应生成提出了一个新颖的数据集。特别是，我们构建了一个配对数据集，其中包括巨魔评论和使用标记的响应策略的反响应，该策略使我们的数据集中的模型可以通过根据指定策略改变反响应来生成响应。我们执行了三个任务来评估数据集的有效性，并通过自动和人类评估评估结果。在人类评估中，我们证明了数据集中微调的模型显示出策略控制的句子生成的性能有了显着改善。

translated by 谷歌翻译